# -*- coding: utf-8 -*-
# @Function: NLP字典文件
# @Description: 提供分词相关的字典和配置，包括停用词列表和关键词权重配置
# @Usage: 被tokenizer.py导入使用，为分词和关键词提取提供基础数据

# 停用词列表
STOP_WORDS = set(["的", "了", "和", "是", "在", "有", "与", "为", "及", "或", "等", "对", "由",
                  "这", "那", "大伙房", "葠窝", "柴河", "汤河", "清河", "石佛寺", "观音阁", "闹德海",
                  "白石", "哪些", "我", "就", "人", "都", "一", "一个", "上", "也", "很", "到",
                  "说", "要", "去", "你", "会", "着", "看", "好", "自己", "什么", "怎么", "为什么",
                  "如何", "请", "给我", "提供", "告诉我", "我想知道", "能否", "可以", "吗", "呢",
                  "啊", "呀", "吧", "么", "嘛", "时", "以上", "以下", "包括", "主要", "相关", "需要"])

# 关键词权重配置
KEYWORD_WEIGHTS = {
        "枢纽": 1.5,
        "泄洪": 1.8,
        "大伙房": 3.5,
        "库容": 2.8,
        "水位": 2.8,
        "防洪": 2.5,
        "设计": 2.0,
        "流域": 2.5,
        "面积": 2.0,
        "标准": 2.0,
        "规模": 2.0,
        "总库容": 3.0,
        "防洪库容": 3.0,
        "兴利库容": 3.0,
        "死库容": 3.0,
        "校核水位": 3.2,
        "设计水位": 3.2,
        "防洪高水位": 3.2,
        "正常高水位": 3.2,
        "兴利水位": 3.2,
        "死水位": 3.2,
        "限制水位": 3.2,
        "汛限水位": 3.2,
        "调度": 2.8,
        "规程": 2.5,
        "建筑物": 2.3,
        "主坝": 2.5,
        "副坝": 2.3,
        "溢洪道": 2.8,
        "输水道": 2.5,
        "闸门": 2.3,
        "流量": 2.5,
        "洪水": 2.8,
        "供水": 2.5,
        "城市": 2.0,
        "监测": 2.3,
        "观测": 2.3,
        "降水": 2.3,
        "径流": 2.3,
        "预报": 2.5,
        "安全": 2.5,
        "管理": 2.0,
        "部门": 1.8,
        "职责": 2.0,
        "权限": 2.0,
        "抚顺": 2.2,
        "沈阳": 2.2,
        "辽阳": 2.0,
        "鞍山": 2.0,
        "营口": 2.0,
        "大连": 2.0,
        "盘锦": 2.0,
        "浑河": 2.3,
        "断面": 2.3,
        "泄量": 2.5,
        "汛期": 2.8,
        "前汛期": 2.8,
        "主汛期": 2.8,
        "后汛期": 2.8,
        "调度规程": 3.0,
        "法律依据": 2.5,
        "技术规范": 2.5,
        "指导思想": 2.5,
        "基本原则": 2.5,
        "主管部门": 2.5,
        "调度单位": 2.5,
        "运行管理": 2.5,
        "检修闸门": 2.8,
        "非常溢洪道": 3.0,
        "渗流观测": 2.5,
        "变形观测": 2.5,
        "测压管": 2.3,
        "自动测报": 2.5,
        "通信方式": 2.3,
        "预见期": 2.5,
        "预报精度": 2.5,
        "DHF模型": 2.8,
        "核心任务": 2.5,
        "安全泄量": 2.8,
        "起调水位": 2.8,
        "时段划分": 2.3,
        "控制断面": 2.8,
        "超标准洪水": 3.0,
        "分期调度": 2.5,
        "启用标准": 2.5,
        "根本原则": 2.5,
        "保证率": 2.5,
        "生态供水": 2.8,
        "优先级": 2.3,
        "年供水量": 2.5,
        "灌溉面积": 2.3,
        "输水规模": 2.5,
        "生态基流": 2.8,
        "单宽渗流量": 2.3,
        "心斜逸出点高程": 2.3,
        "闸墩应力": 2.3,
        "溢流堰应力": 2.3,
        "库水位监测": 2.3,
        "水文自动测报系统": 2.5,
        "抗旱预警水位": 2.8,
        "泥沙调度": 2.8,
        "综合利用调度": 2.8,
        "调度指令": 2.8,
        "调度工作制度": 2.8,
        "调度方案": 2.8,
        "防洪调度方案": 3.0,
        "兴利调度计划": 2.8,
        "应急调度": 3.0,
        "水库枢纽": 2.8,
        "水库运行管理单位": 2.5,
        "农业灌溉": 2.5,
        "工程用水户": 2.5,
        "丰水年份": 2.3,
        "枯水年份": 2.3,
        "取水头部": 2.3,
        "引水工程": 2.5,
        "泄洪流量": 2.8,
        "库水位": 2.8,
        "降水量": 2.3,
        "径流量": 2.3,
        "供水量": 2.5,
        "降雨径流模型": 2.5,
        "水情测报": 2.5,
        "遥测站": 2.3,
        "堰顶高程": 2.3,
        "堰体": 2.3,
        "坝址": 2.3,
        "降水观测": 2.3,
        "雨量筒": 2.0,
        "特殊干旱年": 2.5,
        "发电水位": 2.8,
        "自记雨量计": 2.0,
        "自动雨量计": 2.0,
        "蒸发器": 2.0,
        "水电站": 2.5,
        "装机容量": 2.3,
        "泥沙淤积": 2.5,
        "输沙模数": 2.3,
        "输水工程": 2.5,
        "调水": 2.5,
        "蓄水": 2.5,
        "弃水": 2.3,
        "浑江": 2.2,
        "防洪控制断面": 2.8,
        "大暴雨": 2.8,
        "洪峰流量": 2.8,
        "最大洪水洪峰流量": 3.0,
        "7日洪量": 2.8,
        "洪水起调水位": 2.8,
        "库区管理范围": 2.5,
        "干旱年": 2.5,
        "预警水位": 2.8,
        "应急备用": 2.5
}